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Комп'ютерна модель голосових зв'язок 
та мовного тракту людини 


Розроблені математичне та програмне забезпечення для моделювання та аналізу голосових зв'язок та 
мовного тракту людини, що разом складають підгрунтя для систем синтезу мови на основі математичних 
моделей. 


Вступ 


Метою статті є розробка математичного і програмного забезпечення для моде- 
лювання і аналізу голосових зв'язок та мовного тракту людини. Голосові зв'язки є 
джерелом звуків, які створюються людиною, і спільно з моделями мовного тракту 
складають підгрунтя для систем синтезу мови на основі математичних моделей. Таким 
чином, створення комп'ютерних моделей є актуальним для вивчення мовотворення. 


Математичні моделі 


За основу математичної моделі голосових зв'язок обрана двомасова модель |1), 
згідно з якою кожна з голосових зв'язок описується двома масами, що здійснюють 
автоколивання під впливом потоку повітря в голосовій щілині. Система рівнянь для 
двох мас, що коливаються, записується у вигляді: 


2 
НИСЕЛОДАННСХО; 
а Ї 
2 
СЕЛОМИКОМО, 
а а 


де т і т, - маси, х (І), х,(1) - зміщення мас т, 1 т,, ХуьХр - ПОЧАТКОВІ 


ко) охо) НК, Ск (2) - хо (1) з І ФР (г), 
(1) 


НС (2) - Хо) З КС (2) - хо (2) І, 45 Ру (г), 


положення мас т, і т,, і - час, п і г - коефіцієнти демпфування, К,, Кк, - 
пружність пружин для мас т, і т,, К.- пружність пружини, що з'єднує маси т, і 
т,, і а, - товщина мас т, і т,, І, - діюча довжина голосових зв'язок, /,4,, 1, 4, - 
поверхні мас т, і т,, наякі діють тиски р,, (7) і р,ь(1). 


Система (1) розв'язується спільно з системою рівнянь для змін тиску (будується 
на основі рівнянь Бернуллі), які відбуваються в потоці при його проходженні через 
голосові зв'язки. 


В результаті реалізації моделі визначається потік повітря и, (г) на виході з голо- 


сової щілини. Цей потік використовується як вихідні дані для моделі мовного тракту. 
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Для моделювання розповсюдження акустичних хвиль у мовному тракті як у 
неоднорідній акустичній трубі, що починається між голосовими зв'язками та 
закінчується губами, використовується система лінійних рівнянь в частинних похід- 
них |2), |31, яка записується у вигляді: 


др 2 р ди 

дхо А(х) ді! 

б (х) 2 
и Ах) др 

дх о ро бі! 


де Рог) - тиск у тракті в точці х (0«хХ І, де І- довжина мовного тракту) в 
момент часу 1, и, г) - об'ємна швидкість потоку, р- густина повітря в тракті, с- 
швидкість звуку 1 Ах) - функція площі поперечного перетину. 

Оскільки тракт має неоднорідний поперечний перетин, він розбивається на 
циліндричні секції однакової довжини з постійною площею перетину. 

В якості крайової умови на вході в тракт вибирається потік и, (г), знайдений в 


моделі голосових зв'язок. Виходячи з цього, маєму крайову умову: 
ц(о,т)- и, (г). 


На протилежному кінці тракту задаємо умову 
РІ, г) «0. 


Програмне забезпечення 


В основу алгоритму для реалізації моделі голосових зв'язок |4| покладено 
метод Кутта-Мерсона, який об'єднується в єдину ітераційну процедуру з методом 
послідовної верхньої релаксації для розв'язування нелінійною системою для зміни 
тиску. Для розв'язування системи (2) використовується метод «чехарди» |51, (61. 

Складність фізичного явища, що вивчається, призводить до необхідності ура- 
хування великої кількості параметрів. В свою чергу, математична модель є значною 
мірою чутливою до збурень цих параметрів. Для зручного введення та редагування 
вихідних параметрів моделі та відображення результатів моделювання був розроблений 
графічний інтерфейс користувача. Екранна форма для введення параметрів моделі 
голосових зв'язок наведена на рис. 1. За допомогою програмного забезпечення корис- 
тувач моделі може вивчати вплив параметрів моделі на параметри голосового джерела, 
не будучи фахівцем з математичного моделювання. Необхідні для вивчення джерела 
параметри 1 результати моделювання відображаються у цифровому та графічному 
вигляді за допомогою екранних форм користувача. 

Для вивчення голосового джерела, окрім функції потоку, використовується 
його похідна. Приклад відображення результатів моделювання потоку та його похід- 
ної наведений на рис. 2. 

Набір параметрів для кількісного опису коливань вводиться із залежності 
похідної потоку від часу 1 включає |7|: амплітуду від'ємного піка, тривалість фази 
відкриття, тривалість закритої фази, проміжок часу між додатним 1 від'ємним піка- 
ми, час повернення в початкове положення і вторинні параметри, що походять з них: 
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швидкість відкриття, тривалість фази відкриття голосової щілини відносно періоду 
основного тону, тривалість фази відкритої голосової щілини відносно тривалості 
основного тону тощо. Ступінь змикання голосових зв'язок (відстань між зв'язками) 
відіграє важливу роль у визначенні тривалості фази закриття голосової щілині, різ- 
кості закриття і впливає на якість сприйняття фонації. 


Результати Параметри Вихід 
Побудова графіків 

Параметри модели Початкові умови 
Перша маса МІ Іг) 0125 Я хя 00 хз 00 
Друга маса М2 Іг) и 0.025 5 мог |0.001 хо |0.000 
КІ 008 

і Чі Параметри чисельного метода 
к2 0008 й 

й К31ВЯ | 

ьо |о0002 
ВІ 82 
Кс 1 0.025 «| 5 Р 001 
ца (см) 14 «| 
01 (см) 0.25 «15 
02 (ом) 005 «| 
Параметри для рівнянь Бернуллі 
Ре (г/ом'мс"ме) 0.008 «| 5 
Р (г/см'мс'ме) 0 «15 
Ню (г/см'ме) 1.85Е-7 «| 5 
Ро г/см'єм'см; 000114 
і ) - «ПР 1 Вісь симетрії Ї 

АТ (см'смі) 5 «15 


Рисунок І - Екранна форма для введення параметрів моделі голосових зв'язок 


Результати Параметри Вихід 
Побудова графіків | Параметри 
07 
ОБ ол 0.00049503318 
05 0201 0.0011256524 
04 0301 0.0025749005 
0,401 0.00652080143 
03 
0501 0.01349491 
02 С Графік Меї 
ол 
їм. Відображати лінії 
в Г. Відображати підписи 
12.3 4 5 5 7 8 3 10111 12 13 14 15 15 17 18 19 20 21 22 є « а - зненаууовеа ково 
оз зр а Р 
м ПО 
02 
б Графік Мід 
ол 
х б а 
0102 0.003485 
0202 0.009943 
0302 0.023016 
0402 0.05151 
0502 0.095712 


Рисунок 2 - Результати моделювання голосового джерела у графічному вигляді 
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Набір параметрів для кількісного опису коливань вводиться із залежності 
похідної потоку від часу 1 включає |7|: амплітуду від'ємного піка, тривалість фази 
відкриття, тривалість закритої фази, проміжок часу між додатним і від'ємним піками, 
час повернення в початкове положення 1 вторинні параметри, що походять З них: 
швидкість відкриття, тривалість фази відкриття голосової щілини відносно періоду 
основного тону, тривалість фази відкритої голосової щілини відносно тривалості основ- 
ного тону тощо. Ступінь змикання голосових зв'язок (відстань між зв'язками) відіграє 
важливу роль у визначенні тривалості фази закриття голосової щілині, різкості за- 
криття і впливає на якість сприйняття фонації. 

Для введення і редагування вихідних даних моделі мовного тракту, зокрема, 
задання геометричної форми тракту та відображення результатів моделювання вихід- 
ного мовного сигналу у цифровому та графічному вигляді був розроблений графіч- 
ний інтерфейс користувача, екранна форма якого наведена на рис. 3. За його допомогою 
користувач моделі може задавати бажану форму мовного тракту та вивчати її вплив 
на вихідний мовний сигнал. На рис. 3 наведені форма тракту (верхній графік) та вихід- 
ний сигнал (нижній графік) для російського голосного «а». Параметри мовного тракту 
для російських голосних були використані з роботи (|З. 


Форма тракту Результати Параметри Вихід 


Форма тракту | Параметри | 


Кількість Ширина кожного, см 
5 21 (05 ці беріти | 


| Площа і-го циліндра, см? - 
й 


І | «є Графік МеЇ 


м Відображати лінії 


7 8 9 10 11 12 13 14 15 16 17 | 


7 Графік МІд 


БУ 


10.022676 3.8534743Е-8 


, 045352 0.0018063515 
| 


| 058028 ол6119834 
| оар04 12771678 


1011338 2.2185781 
| 


Рисунок 3 - Екранна форма для введення параметрів тракту 
і візуалізації вихідного сигналу 


Висновки 


Розроблені в роботі чисельні алгоритми та програмне забезпечення дають змогу 
синтезувати і досліджувати мовний сигнал, використовуючи на вході в мовний тракт 
потік, розрахований за моделлю голосових зв'язок. Розроблений інтерфейс користу- 
вача дозволяє у зручному режимі вивчати вплив параметрів голосових зв'язок та 
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форми мовного тракту на вихідний сигнал. Наведені в роботі результати моделю- 
вання добре узгоджуються з існуючими на цей час уявленнями про джерело звуків, 
яким є голосові зв'язки людини, та з наведеними в літературі результатами |9-111, 
одержаними за іншими моделями голосових зв'язок. Якість сигналу на виході з мов- 
ного тракту оцінюється експертами безпосередньо при відтворенні відповідних звуків. 
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Компьютерная модель голосовьгх связок и речевого тракта человека 

Разработанью математическоєе и программное обеспечениє для моделирования и анализа голосовьїх 
связок и речевого тракта человека, которьте вместе составляют основу для систем синтеза речи, 
построенньх на математических моделях. 
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